# config.py
OCR_ENGINE = 'spire'   # 可选 'tesseract'、'paddleocr' 或 'spire'
PDF_PARSER = 'pymupdf'      # 可选 'pdfplumber'
DESENSE_METHODS = ['mask', 'blur', 'replace']
SENSITIVE_TYPES = ['ID_CARD', 'PHONE', 'NAME', 'ADDRESS', 'BANK_CARD']
LOG_PATH = ''  # 空字符串表示输出到控制台，而不是文件

# NER模型缓存配置
NER_MODEL_CACHE_DIR = './models/ner_cache'  # NER模型缓存目录
NER_MODEL_NAME = 'ckiplab/bert-base-chinese-ner'  # 使用的NER模型名称
NER_TOKENIZER_NAME = 'bert-base-chinese'  # 使用的分词器名称

# 遮罩颜色配置
MASK_COLOR = "#000000"  # 默认黑色遮罩
MASK_COLORS_PRESETS = [
    {"name": "黑色", "color": "#000000"},
    {"name": "灰色", "color": "#808080"},
    {"name": "红色", "color": "#FF0000"},
    {"name": "蓝色", "color": "#0000FF"},
    {"name": "绿色", "color": "#008000"}
]

# 马赛克配置
DEFAULT_MOSAIC_SIZE = 10  # 默认马赛克块大小

# 文本替换配置
DEFAULT_REPLACE_CHAR = 'X'  # 默认替换字符
REPLACE_CHAR_PRESETS = ['X', '*', '#','?','!']

# NER实体类型配置
# 设置为True的实体类型将被识别为敏感信息
NER_SENSITIVE_TYPES = {
    'CARDINAL': False,
    'DATE': True,
    'EVENT': False,
    'FAC': True,
    'GPE': True,
    'LANGUAGE': False,
    'LAW': False,
    'LOC': True,
    'MONEY': False,
    'NORP': True,
    'ORDINAL': False,
    'ORG': True,
    'PERCENT': False,
    'PERSON': True,
    'PRODUCT': False,
    'QUANTITY': False,
    'TIME': True,
    'WORK_OF_ART': False,
}

# Spire.OCR配置
SPIRE_OCR_CONFIG = {
    'model_path': r'D:\OCR\win-x64',  # 请修改为实际的模型路径
    'language': 'Chinese'
}
